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摘 要 ; [目的 /意义 ] 在 对 美国 英国、 欧盟 \ 日 本 、 德 国 等 地 区 或 国家 对 TDM 行为 的 立法 或 司法 应 对 进行 比较 分 析 基 础 
上 ,提出 我 国 TDM 合理 使 用 规则 的 设计 思路 。| 方法/ 过程 | 首先 分 析 人 工 智 能 时 代 文 本 与 数据 挖 握 的 技术 特征 
及 其 挑战 ,介绍 出 版 商 和 图 书馆 有 关 TDM 合理 使 用 的 立场 分 歧 , 之 后 在 对 代表 性 国家 有 关 TDM 合理 使 用 法 律 应 
对 机 制 进行 比较 分 析 基 础 上 ,从 TDM 例外 的 主体 、 客 体 、 目 的 、 行 为 及 其 他 条 件 等 方面 ,论证 我 国 TDM 合理 使 用 规 
则 的 具体 内 容 。[ 结果 /结论 ] 任 何 机 构 或 个 人 基于 科学 研究 或 其 他 合理 目的 对 任何 作品 以 复制 .提取 、 改 编 或 有 
限 传播 方式 进行 文本 和 数据 挖 据 构 成 合理 使 用 ,但 利用 非 合 法 来 源 作 品 须 支 付 合理 的 使 用 费 。 
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文本 与 数据 挖掘 TDM 合理 使 用 例外 


人 工 智能 被 看 作 是 21 世纪 三 大 尖端 技术 ( 基因 工 
纳米 科学 人工 智 能 ) 之 一 ,许多 国家 出 台 规划 将 人 
各 能 上 升 为 国家 战略 。 当 前 人 类 已 经 从 信息 时 代 返 
进 Y 数据 驱动 的 “智能 时 代 ” ,人工 智 能 需要 通过 大 数 
所 区 习 来 建立 其 智能 。 文 本 与 数据 挖 气 (Text and Data 
Mhe, TDM) 是 众多 交叉 学 科 的 重要 支撑 技术 ,是 人 
工 葡 能 .区 块 链 、 云 服务 等 技术 应 用 的 基础 ,不 仅 对 加 
速 秤 研发 现 . 推 动 技术 创新 .创新 商业 模式 ,促进 经 济 
发 展 具有 重要 价值 ,而 且 在 公共 文化 行业 大 有 可 为 ,为 
图 带 馆 等 机 构 基于 TOM 提供 个 性 化 智能 服务 提供 坚 
强 授 术 保证 。 然 而 由 于 运用 TOM 技术 很 可 能 会 对 受 
著作 权 保 护 的 作品 或 数据 库 内 容 进行 复制 .提取 、 重 构 
和 传播 ,该 行为 是 否 属于 合法 行为 一 直 是 理论 界 和 实 
务 界 热 议 的 焦点 。 大 部 分 国家 和 地 区 还 未 有 效 建立 
TDM 合理 使 用 规则 ,只 有 欧盟 英国、 日本、 美国 等 少 
数 地 区 与 国家 的 立法 和 司法 给 予 了 相应 回应 。 根 据 
CNKI 数据 库 统计 ,国内 有 关 TDM 著作 权 问 题 的 文献 
约 有 20 余 篇 ,并 且 现 有 理论 研究 更 多 注重 于 对 部 分 国 
家 立法 经 验 的 介绍 ,系统 论证 我 国 TDM 合理 使 用 规则 
具体 内 容 的 文献 较为 少见 。 新 技术 的 发 展 必然 会 打破 
著作 权 法 的 传统 利益 平衡 机 制 ,如 何 重 构 新 技术 环境 
下 著作 权利 益 平衡 ,构建 适应 我 国 国情 的 TDM 合理 使 
用 新 型 规则 对 于 促进 我 国 科 研 创新 和 经 济 发 展 具 有 重 


加 


m 


要 意义 。 故 本 文 在 全 面 比较 美国 ,英国 .欧盟 日 本 、 德 
辐 等 国家 或 地 区 法 律 应 对 机 制 基础 上 ,详细 论 了 我 
TDM 合理 使 用 规则 设计 内 容 及 其 理由 。 


1 人 工 智 能 时 代 文 本 与 数据 挖掘 技术 特 
征 及 其 挑战 


1.1 人 工 智 能 时 代 TDM 的 技术 特征 

TDM 是 一 般 指 从 大 量 文本 或 数据 中 提取 数据 、 组 
织 信息 和 发 现 知识 的 过 程 。2014 年 英国 修订 的 著作 
权 法 将 TDM 定义 为 利用 自动 分 析 技 术 对 文本 和 数据 
进行 分 析 以 获取 模式 、 趋 势 及 其 他 有 用 信息 "” 。2019 
年 3 H 26 日 欧盟 议会 通过 的 《数字 单一 市 场 版 权 指 
令 》( Directive on Copyright in the Digital Singles Mar- 
ket) ^ 3A Jy TDM 是 指 任何 旨 在 对 数字 格式 的 文本 和 
数据 进行 分 析 的 自动 分 析 技 术 , 以 便 生 成 包括 但 不 限 
于 模型 .趋势 .相关 性 等 在 内 的 信息 。TDM 具有 如 下 
技术 特征 : 
1.1.1 主体 的 特殊 性 

TDM 实施 不 仅 需要 进行 挖掘 算法 开发 ,还 需要 经 
过 数据 准备 与 管理 .数据 预 处 理 与 转化 .算法 调试 与 应 
日 .结果 分 析 与 呈现 等 复杂 流程 ,个 人 一 般 不 具备 对 海 
量 文本 和 数据 进行 复制 提取、 处理、 对 比 、 分 析 的 条 件 
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和 能 力 ,实施 者 一 般 为 具备 一 定 技术 和 物质 条 件 的 组 
织 机 构 (例如 图 书馆 、 大 学 ,企业 或 其 他 研究 机 构 等 ) 。 
1.1.2 ”对象 的 广泛 性 

包括 文字 、 图 片 .视频 ,声音 ,数据 等 在 内 的 任何 数 
字形 式 材料 都 可 成 为 数据 控 据 对 象 。 考 虑 到 与 研究 主 
题 相 关 的 材料 获取 越 多 , 则 通过 挖掘 技术 分 析 自动 得 
出 的 结论 更 具 通用 性 与 准确 性 ,因此 TDM 采用 “样本 
= 总 体 "的 全 数据 模式 来 最 大 范围 获取 全 部 相关 材料 。 
1.1.3 过 程 的 转化 性 

过 程 的 转化 性 既是 指数 据 格式 的 转化 ,所 获取 的 
各 类 型 数据 (包括 非 结 构 化 数据 、 半 结构 化 数据 和 结构 
化 数据 ) 须 转化 成 能 够 被 计算 机 处 理 的 结构 化 数据 ,又 
是 指数 据 挖 据 过 程 中 不 可 避免 会 对 受 著作 权 保护 的 文 
本数 据 进行 复制 ,但 是 输出 结果 并 不 直接 呈现 原文 内 
党 是 将 其 作为 分 析 背 景 资料 以 发 现 模式 .趋势 及 规 
a. 
结果 的 价值 性 
作为 发 掘 潜在 价值 的 重要 工具 ,TDM 在 商业 、 教 
尝 s 笠 研 及 社会 管理 中 的 应 用 蕴含 着 巨大 的 经 济 价值 
会 机 会 ,尤其 是 对 于 医学 制药 ,金融 以 及 其 他 需 
:进行 市 场 分 析 的 领域 ,如 提高 科研 效率 ,发 据 隐藏 信 
遍 种 开发 新 知识 ,改进 研究 过 程 和 基础 ,探索 新 的 领 
域 , 警 等 。 
1,8? 利用 TDM 所 面临 的 侵权 风险 
TDM 所 挖掘 的 文本 或 数据 ,包括 任何 不 受 著作 权 
保 挤 或 受 著作 权 法 保护 的 材料 。TDM 实施 流程 往往 
需要 对 材料 进行 复制 处 理 , 但 不 同 的 TOM 技术 复制 的 
方 博 或 数量 具有 很 大 差异 性 ,大 多 时 候 TDM 分 析 的 前 
提 是 重复 复制 整个 作品 ” ,但 有 时 候 TDM 技术 仅 对 目 
标 文本 进行 “逐个 “单独 "处 理 , 每 次 只 复制 单个 或 少 
量 的 单词 或 数据 ,而 且 并 不 保留 或 固定 抓 取 副本 ,只 是 
计算 单词 或 数据 出 现 次 数 ,此 时 TDM 行为 一 般 不 构成 
著作 权 法 意义 上 的 复制 行为 。 本 文 主要 探讨 对 目标 文 
本 进行 大 量 复制 的 TDM 技术 的 实施 所 导致 的 侵权 风 
险 。 具 体 包括 : 
1.2.1 可 能 侵犯 著作 权 人 的 复制 权 

我 国 于 2020 年 11 月 修订 的 《著作 权 法 ) 将 复制 权 
定义 为 :以 印刷 ,复制 . 拓 印 .录音 .录像 翻录 、 翻 拍 数 
字 化 等 方式 将 作品 制作 一 份 或 者 多 份 的 权利 。 我 国学 
理 界 一 般 认 为 ,构成 著作 权 法 意义 上 的 “复制 行为 " 须 
满足 两 个 条 件 , 即 应 在 有 形 物 质 载体 上 再 现 作品 ,而 且 
作品 应 “固定 "在 有 形 载体 上 中 TDM 实施 流程 一 般 
包括 信息 抽取 、 语 义 分 析 、 关 系 计 算 及 知识 发 现 4 个 步 


又 。 在 对 材料 进行 挖掘 处 理 过 程 中 ,往往 会 涉及 到 大 
量 的 版 权 作 品 ,不 管 是 将 这 些 数据 读 人 系统 或 者 是 进 
行 格式 转换 和 数据 分 析 , 均 涉及 到 受 著作 权 人 控制 的 
复制 行为 。 由 于 大 量 孤 儿 作品 存在 以 及 系统 无 法 有 效 
识别 目标 对 象 的 权利 状态 ,车 行为 人 未 获得 权利 人 授 
权 或 不 符合 相关 侵权 升 免 条 件 , 则 TDM 行为 很 可 能 侵 
犯 著 作 权 人 的 复制 权 。 
1.2.2 可 能 侵犯 著作 权 人 的 数据 库 权 
对 于 具有 独创 性 的 数据 库 由 复制 权 予 以 保护 ,对 
于 不 具有 独创 性 的 数据 库 是 否 提供 著作 权 保护 ,各 国 
意见 并 不 一 致 。 为 更 好 促进 数据 库 产 业 发 展 ,欧盟 率 
先 颁布 《数据库 保护 指令 》(1996)” ,建立 了 新 的 特殊 
权利 一 一 数据 库 权 ,随后 德国 将 非 独创 性 数据 库 纳 人 
邻接 权 保护 范围 ,英国 则 对 数据 库 进 行 单独 立法 保护 。 
在 美国 由 于 广大 公众 对 “信息 自由 ”损害 和 权利 垄断 
的 担忧 ,美国 并 没有 建立 新 的 特殊 权利 制度 , 转 而 采取 
反 不 正当 竞争 法 进行 保护 。 在 欧盟 地 区 只 要 制作 者 对 
数据 库 相关 设施 设备 进行 了 实质 性 投入 , 则 可 获得 数 
据 库 权 的 特殊 保护 。 根 据 《 数 据 库 保护 指令 》 第 7 条 可 
知 ,数据 库 权 的 主要 内 容 是 制作 者 有 权 禁 止 抽取 (ex- 
traction) (将 数据 库 的 全 部 或 实质 性 部 分 以 任何 方式 或 
手段 永久 性 或 暂时 性 地 转移 到 其 他 介质 之 中 ) 和 再 利 
用 (re-utilization) (通过 复制 出租、 网 络 或 其 他 传输 方 
式 ,以 任何 形式 向 公众 提供 数据 库 的 全 部 或 实质 性 部 
分 ) 数 据 库 的 全 部 或 实质 性 部 分 。 在 TDM 过 程 中 , 往 
往 不 可 避免 地 会 涉及 到 抽取 行为 , 若 行为 人 未 获得 权 
利 人 授权 ,又 无 其 他 其 免 事由 , 则 可 能 侵犯 著作 权 人 的 
数据 库 权 。 须 指出 ,由 于 我 国 并 未 规定 数据 库 权 , 故 针 
对 非 独创 性 数据 库 的 TDM 侵权 风险 较 低 。 
1.2.3 ”可 能 侵犯 著作 权 人 的 其 他 权利 

从 大 的 权利 类 型 来 看 ,TDM 行为 人 还 可 能 侵犯 著 
作 权 人 的 演绎 权 和 传播 权 。 我 国 著作 权 法 未 直接 采用 
演绎 权 概 念 而 是 将 其 分 解 为 翻译 权 改编 权 .汇编 权 等 
类 型 。 从 权利 内 容 来 看 ,TDM 行为 人 很 可 能 侵犯 著作 
权 人 的 改编 权 , 因 为 TDM 技术 应 用 需要 对 目标 文本 进 
行 识别 和 转 码 , 转 码 行为 是 “改变 ,编排 目标 对 象 的 表 
达 形 式 ,从 而 形成 新 的 研究 样本 ”9 ,TDM 过 程 中 的 
“ 转 码 行为 ”与 我 国 著 作 权 法 意义 上 的 “改编 行为 ”在 
很 大 程度 上 具有 同 质 性 。 此 外 ,作为 受 技术 发 展 影响 
最 为 明显 的 一 项 权利 ,传播 权 是 继 复制 权 、 演 绎 权 后 出 
现 的 著作 权 经 济 权 利 的 统称 ,包括 表演 权 、 出 租 权 广 
播 权 、 展 览 权 和 信息 网 络 传播 权 等 类 型 。 我 国 著作 权 
法 没有 “传播 权 ” 概 念 ,而 是 通过 增加 “信息 网 络 传播 
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权 ” 来 回应 新 技术 的 发 展 。 数 据 挖 气 最 终 分 析 结 果 既 


学 研究 例外 以 及 《数据 库 保护 指令 》(1996 ) 第 9 条 规 


可 能 以 简单 结论 方式 呈现 ,也 可 能 以 长 篇 幅 的 商业 或 
学 术 报告 方式 进行 呈现 ,不 管 哪 种 呈现 形式 均 可 能 
及 原作 品 表 达 或 数据 库 权 利 内 容 , 若 TDM 行为 通过 线 
下 或 线 上 方式 向 公众 公开 该 内 容 就 很 可 能 侵犯 著作 权 
人 的 传播 权 。 
1.3 利用 TDM 所 面临 的 法 律 困境 

由 于 TDM 属于 新 兴 技 术 , 尽 管 欧盟 日本、 英国 等 
少数 国家 及 时 修订 法 律 将 TDM 纳入 著作 权 合 理 使 用 
范围 ,但 大 多 数 国家 还 未 来 得 及 针对 TDM 技术 做 出 制 
度 安排 回应 ,其 现 有 的 著作 权 合理 使 用 规定 仅 能 涵盖 
很 少量 满足 条 件 的 TDM 行为 , 绝 大 部 分 TDM 行为 仍 
面临 很 大 的 法 律 适用 困境 。 例 如 我 国 于 2020 年 11 月 
册 全 了 新 《著作 权 法 》, 但 缺乏 TDM 专项 条 款 ,TDM 行 
为 天 法 满足 该 法 第 24 条 第 1 款 第 1 项 (个 人 使 用 ) ,第 
2 gi (38 438) ,第 6 项 (教学 科研 ) 第 8 项 (文化 机 
构 5 疼 合理 使 用 规定 。 即 便 就 已 出 台 了 相应 规则 的 国 
察 击 言 ,由 于 受到 个 案 判断 或 适用 条 件 限制 ,TDM 行 
疙 是否 构成 合理 使 用 也 面临 法 律 上 的 不 确定 性 。 目 前 
TOM 合理 使 用 机 制 主要 分 为 两 种 类 型 , 即 以 美国 为 代 
徐 的 灵活 例外 制度 和 以 欧盟 为 代表 的 法 定 例外 制度 ， 
倒 议 两 类 制度 也 面临 相应 困境 。 
1.3 沁 灵活 例外 制度 面临 个 案 判断 困境 
.三 美国 版 权 成 文法 中 并 没有 有 关 TOM 的 明确 规定 ， 


PER IE FH 107 条 合理 使 用 * 四 要 素 " 来 对 TDM 
行 汶 是 否 构成 合理 使 用 进行 综合 判断 ,其 中 最 典型 的 
案件 是 Google Jr E 4548 38 7 和 Hathitrust 数字 图 书 
TRES, 法院 最 终 认定 Google 和 Hathitrust 所 实施 的 
TDM 行为 具备 高 度 的 转换 性 ,构成 合理 使 用 。 虽 然 美 
国 灵活 例外 很 大 程度 上 推动 了 TOM 技术 的 应 用 和 发 
展 , 但 该 制度 也 存在 较 大 缺陷 ,由 于 依靠 司法 个 案 进行 
合理 性 判断 ,无 法 针对 TDM 行为 向 公众 提供 稳定 的 构 
成 合理 使 用 的 法 律 预 期 ,也 不 利于 人 工 智能 产业 发 展 ， 
如 在 美国 2018 年 的 “TVEyes 案 " 呈 中 ,第 二 巡回 法 院 
推翻 一 审 法 院 部 分 判决 结论 ,认为 TYEyes 公司 为 公众 
提供 电视 广播 内 容 视频 片段 剪辑 (不 超过 10 分 钟 ) 的 
搜索 和 浏览 服务 ,很 可 能 构成 原作 品 的 替代 品 ,不 构成 
合理 使 用 。 
1.3.2. 法定 例外 制度 面临 条 件 过 严 困境 

欧盟 传统 著作 权 法 对 TDM 缺乏 明确 的 适用 空间 ， 
如 欧盟 《信息 社会 版 权 指令 》(2001) ”第 5 条 第 LC 
规定 的 临时 复制 例外 、 第 5 条 第 2 款 和 第 3 款 规定 的 
基于 非 商业 性 利用 目的 非 强制 性 的 个 人 使 用 例外 和 科 


mi 


定 的 基于 非 商业 性 利用 目的 非 强制 性 的 个 人 使 用 例外 
和 科学 研究 例外 ,无 法 有 效 满足 大 多 数 TDM 行为 。 欧 
嚼 《数字 单一 市 场 版 权 指令 》(2019 ) 提出 了 基于 科研 
目的 以 及 文本 与 数据 挖掘 的 两 种 TDM 例外 ,虽然 这 两 
项 例外 能 促进 TDM 行业 发 展 ,但 基于 科研 目的 的 例外 
受 限于 科研 目的 ,适用 范围 较 窗 ;而 基于 文本 与 数据 控 
掘 的 例外 , 则 附加 了 权利 人 的 权利 声明 保留 要 求 ,这 使 
TDM 行为 面临 潜在 的 侵权 风险 。 


2 ”有 关 文 本 与 数据 挖掘 合理 使 用 立场 分 睹 


2.1 出 版 商 有 关 TDM 合理 使 用 的 立场 
随 着 TDM 技术 不 断 发 展 , 其 法 律 确定 性 问题 日 益 
突出 。 纵 观 著作 权 法 发 展 历史 可 知 ,权利 人 的 “权利 
束 " 不 断 丰 富 和 扩张 ,以 适应 新 传播 技术 的 发 展 。 针 对 
新 出 现 TDM 技术 可 能 给 权利 人 利益 造成 负面 影响 的 
情况 ,出 版 商 普遍 希望 通过 立法 修订 来 赋予 权 利 人 (出 
版 商 ) 新 的 权利 类 型 以 抗衡 新 技术 的 应 用 ,这 种 新 的 权 
利 就 是 挖掘 权 (the right mine) 。 国 际 出 版 商 针 对 用 户 
TDM 合理 使 用 的 立场 具体 包括 : 
2.1.1 主张 通过 许可 协议 模式 达成 TDM 最 佳 实践 
由 于 大 多 数 国家 或 地 区 并 未 专门 制定 有 关 TDM 
的 法 律 条 款 ,多 数 出 版 商 主 张 通过 许可 协议 来 解决 
TDM 面临 的 法 律 确 定性 问题 ,因为 通过 许可 协议 能 细 
致 规定 TDM 行为 ,而 “ 非 商业 研究 ”概念 模糊 不 清 , 而 
H. TDM 例外 条 款 会 破坏 对 出 版 商 持续 投资 出 版 高 质 
量 内 容 的 激励 机 制 , 同 时 认为 目前 也 没有 确实 证 据 表 
明 缺 乏 TDM 例外 制度 会 导致 经 济 或 竞争 落后 。 出 版 
商 在 不 同 场合 不 断 发 表 自 己 的 主张 ,如 在 2013 年 欧盟 
就 “欧洲 许可 证 ”举办 了 利益 相关 者 对 话 , 与 会 出 版 商 
建议 就 TDM 问题 采用 多 方 合作 的 市 场 机 制 ,承诺 为 非 
商业 研究 人 员 开 展 TDM 提供 相应 便利 ,但 前 提 是 基于 
许可 协议 条 款 "”。2014 年 欧洲 出 版 商 协会 明确 反对 
在 著作 权 法 中 引入 TDM 合理 使 用 条 款 ,认为 通过 许可 
协议 就 能 满足 TDM 实践 需求 并 降低 侵权 和 滥用 风险 。 
司 际 科技 医药 出 版 商 联 盟 ( International Association of 
Scientific , Technical & Medical Publishers, STM ) 曾 在 
2015 年 发 表意 见 认 为 TDM 法 律 确定 性 可 通过 许可 协 
议 实现 ,TDM 例外 条 款 会 破坏 确保 生产 高 质量 内 容 的 
投资 激励 机 制 ” 。 
2016 年 11 月 STM 针对 公布 的 《数字 单一 市 场 版 
权 指 令 ( 草案 )》 认 为 ,该 草案 指令 规定 的 例外 条 款 会 
产生 以 下 意 想 不 到 的 后 果 :Q 引 入 公私 伙伴 关系 的 概 
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念 可 以 为 商业 机 构 可 能 滥用 TDM 例外 提供 便利 。 寿 
研究 人 员 部 分 资金 来 源 于 商业 机 构 , 其 目标 是 创造 商 
业 价值 , 则 挖掘 应 遵循 许可 协议 条 球 ;或 者 雇佣 非 营 利 
或 学 术 机 构 为 商业 机 构 进行 文本 挖掘 ,必须 先 获 得 授 
Bt, OTDM 例外 适用 的 关键 是 要 合法 获取 相关 内 容 。 
必须 明确 指出 ,挖掘 非法 内 容 或 通过 后 期 再 利用 方式 
挖掘 不 同 著 作 权 例外 下 的 副本 都 是 不 允许 的 。 这 种 例 
外 不 应 允许 非 客户 通 过 文献 传递 或 作为 著作 权 例 外 的 
受益 人 方式 获得 内 容 后 进行 挖掘 。@@O 对 于 出 版 商 平 台 
上 的 操作 系统 来 说 ,很 难 区 分 真正 的 文本 挖掘 者 和 试 
图 通过 大 量 非法 复制 作品 来 侵犯 版 权 的 人 。 他 们 都 通 
过 自动 方式 大 量 下 载 资料 ,当前 指令 中 关于 技术 保护 
的 用 词 模糊 不 清 , 造 成 混乱 ,并 使 出 版 商 内 容 面 临风 
险 e= 只 要 提取 过 程 一 完成 ,作品 或 主题 材料 的 副本 


就 应 立即 删除 。STM 还 认为 美国 开展 TDM 须根 据 许 
可 协议 进行 ,只 有 在 没有 市 场 蔡 代 或 给 权利 人 造成 市 


EU: RHET , 才 可 能 被 视 为 合理 使 用 ;英国 和 法 国 
的 琢 权 例外 都 是 科学 研究 , 比 指令 草案 更 严格 要 求 非 
RREH 

主张 利用 出 版 商 提供 的 API 及 平台 实施 TDM 
午 多 出 版 商 主 张 通过 应 用 专用 程序 接口 (Applica- 
tién Programming Interface, API ) 或 挖掘 平台 来 提供 
TX 服 务 ;针对 路 平台 许可 难题 , 数 千 家 出 版 商 与 
Cro Ref 公司 于 2014 年 5 月 联合 推出 了 CrossRef TDM 
MES ,以 便 提供 通用 的 API 和 许可 协议 框架 。 出 版 
商 变 求 用 户 利用 API 平台 开展 TDM 的 依据 主要 有 :@ 
确保 系统 平台 运行 。 若 允许 用 户 采用 任意 第 三 方 软件 
在 露 数据库 平台 上 进行 数据 批量 抽取 或 下 载 ,将 会 对 
其 平台 运行 造成 巨大 压力 或 可 能 导致 系统 崩溃 ,影响 
用 户 的 正常 使 用 ,加 大 了 出 版 商 违约 的 侵权 风险 。@ 
具有 相关 法 律 依据 。 如 英国 2014 年 修订 的 著作 权 法 
例外 条 款 相关 解释 文件 指出 ,出 版 商 可 采取 合理 措施 
(如 合理 限制 下 载 速度 ,控制 特定 时 间 内 用 户 访问 量 
等 ,Elsevier 甚至 认为 合理 措施 包括 要 求 通过 专门 的 


实施 TDM 作出 了 比较 严格 的 限制 ” ,具体 表现 为 :四 
限制 挖掘 范围 ,只 针对 XML 文件 ,使 用 图 像 等 信息 时 
应 与 相关 权利 人 协商 以 获得 重新 利用 的 授权 ;@ 限 制 
挖掘 过 程 , 明 确 禁 止 使 用 任何 非 API 的 自动 下 载 设备 
或 软件 来 获取 其 网 站 内 容 ,并 严格 限制 了 访问 数量 和 
访问 频率 ;@ 限 制 挖掘 结果 ,尽管 允许 研究 人 员 将 挖掘 
结果 用 于 存储 于 机 构 知 识 库 中 或 发 表 论文 ,但 禁止 创 
建 .删改 ,翻译 任何 基于 语料库 的 衍生 作品 ,以 避免 对 
其 产品 和 服务 产生 竞争 性 威胁 。Springer 的 TDM 政策 
也 具有 代表 性 。Springer 公司 与 美国 著作 权 结 算 中 心 
( Copyright Clearance Center, CCC ) 合作 提供 路 平台 的 
TDM 服务 ” ,尽管 Springer 的 TDM 政策 相对 宽松 , 允 
许 订阅 机 构 的 研究 人 员 使 用 PubMed, Web of Science 
或 Springer Nature 的 元 数据 API 等 工具 来 实施 TDM, 
并 且 可 直接 从 其 平台 上 下 载 全 文 数据 内 容 , 不 强制 要 
求 注册 APT 密 钥 ,但 限制 下 载 速 率 , 每 秒 1 次 请 求 ( 若 
注册 申请 API 密 钥 ,下 载 速 率 为 每 分 钟 150 个 请 求 ) ， 
并 要 求 研 究 人 员 须 采取 合理 措施 确保 数据 安全 ,如 数 
据 存储 在 内 部 安全 服务 器 ,禁止 第 三 方 访问 ,只 能 在 
TDM 项 目 期 间 使 用 等 。 
2.2 图 书馆 有 关 TDM 合理 使 用 的 立场 

TDM 关系 到 社会 公众 能 否 享 有 自由 获取 知识 的 
权利 , 面 对 权 利 人 针对 TDM 技术 引发 的 著作 权利 益 冲 
突 所 发 起 的 紧 副 和 “ 围 巢 ”措施 ,作为 公共 利益 代言 人 
的 重要 团体 ,图 书馆 界 主动 出 击 , 发 出 自己 的 声音 , 提 
出 “有 阅读 权 就 有 挖掘 权 ” 的 重要 主张 ,在 为 公众 积极 
争取 TDM 权利 方面 开展 了 一 系列 工作 ,尤其 是 着 力 解 
决 TDM 所 面临 的 法 律 不 确定 问题 ,旗帜 鲜明 地 阐明 了 
国际 图 书馆 界 立场 ,获得 了 广大 消费 者 组 织 的 认同 。 
2.2.1 主张 尽快 完善 TDM 合理 使 用 规则 
国际 图 联 ( International Federation of Library Asso- 
ciations ,IFLA ) 于 2013 年 发 布 4 关 于 文本 与 数据 挖掘 的 
声明 》” 指 出 ,作为 促进 学 习 和 创造 新 形式 的 重要 工 
具 ,TDM 的 法 律 确 定性 只 能 通过 (法 定 ) 例外 来 实现 ， 


API 实施 文本 挖掘 ) 来 维护 网 络 安全 和 稳定 性 ,只 要 
这 些 措施 不 阻止 或 不 合理 限制 任何 研究 人 员 从 例外 中 
受益 的 能 力 '”。@ 区 分 界定 两 类 行为 。 出 版 商 对 两 
类 行为 即 “ 挖 气 ”" 和 “阅读 ”的 内 涵 进 行 严格 区 分 ,认为 
这 是 两 种 具有 根本 性 区 别 的 信息 活动 , 需 制 定 不 同 的 
许可 协议 使 用 条 款 来 确定 TDM 的 权利 范围 。 

一 些 出 版 商 针 对 其 平台 提供 API 服务 设置 了 较 多 
的 限制 条 件 , 以 Elsevier 的 TDM 政策 为 例 :由 其 TDM 
注册 登记 表 可 知 ,Elsevier 开展 的 APT 服务 对 订阅 用 户 


许可 协议 不 能 作为 TDM 的 解决 方案 ,并 认为 信息 应 该 
不 受 限制 地 进行 利用 ,这 对 社区 的 教育 和 文化 福利 的 
增进 至 关 重 要 。IFLA UN, ARZ TDM 例外 ,研究 者 
在 开展 重要 研究 和 数据 驱动 的 创新 过 程 中 就 会 面临 由 
于 法 律 不 确定 性 而 带 来 的 风险 。 欧 洲 研 究 图 书馆 协会 
(the Association of Europe Research Libraries ,LIBER ) 发 
布 了 《数字 时 代 知 识 发 现 海牙 宣言 》” ,提出 用 户 享 有 
隐私 权 、 信 息 权 及 挖掘 权 ,认为 政策 制定 者 应 明晰 法 律 
内 容 , 明 确 阅 读 权 包括 “挖掘 权 ” ,确保 内 容 挖 据 不 侵 
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犯 著作 权 及 邻接 权 , 并 建议 各 大 学 、 研 究 资助 者 研究 
机 构 和 商业 机 构 制定 鼓励 采用 内 容 挖 气 研 究 方法 的 政 
策 。 

图 书馆 界 呼吁 从 法 律 制度 上 完善 TDM 合理 使 用 
规则 ,主要 缘由 包括 :中 通过 许可 协议 规制 TOM 具有 
很 大 吉 端 。 在 许可 协议 谈判 过 程 中 ,由 于 出 版 商 ( 权利 
人 利益 代表 ) 和 图 书馆 (公共 利益 代表 ) 地 位 不 平等 ， 
出 版 商 往往 会 利用 华 断 优势 地 位 ,施加 单 边 意志 ,通过 
保留 修改 条 款 权利 或 签订 霸王 条 款 ,不 合理 限制 用 户 
实施 TDM 行为 ,协议 长 期 有 效 性 也 难以 保证 。 此 外 ， 
由 于 TOM 所 利用 的 信息 的 异常 丰富 ,已 经 远 远 超出 了 
被 许可 使 用 的 研究 数据 库 , 这 也 使 许可 使 用 方案 变 得 
不 切实 际 。@ 和 制定 TDM 例外 条 款 有 利于 提升 国家 国 
EPJ 一 些 国 家 已 经 将 TDM 合理 使 用 制度 纳入 
其 芍 作 权 法 律 体系 当中 ,例如 美国 和 加 拿 大 基于 合理 
合用 框架 体系 规制 TDM 行为 ,欧盟 、 英 国 、 日 本 则 制定 
TESNIH TDM 合理 使 用 条 款 。 这 些 国家 通过 修订 法 
HEMET TDM 高 效 实施 ,有 助 于 其 科研 人 员 更 好 把 握 
科研 创 新 的 主动 权 ,从 而 促进 技术 创新 和 经 济 发 展 。 
223 反对 限制 使 用 TDM 相关 工具 软件 
CN 针对 大 多 数 出 版 商 要 求 用 户 使 用 专门 的 API 或 控 
MIS roe pl TDM 的 要 求 , 图 书馆 等 信息 服务 机 构 则 
持 及 对 态度 ,主要 理由 如 下 :DAPI 平台 本 身 存在 较 多 
NON. LIBER 等 组 织 认为 Elsevier 的 API 注册 条 款 过 
隆 噶 格 , 如 只 允许 挖掘 文本 ,将 图 片 图表、 视频 等 排除 
在 鱼 , 明 确 禁止 使 用 机 器 人 、 几 蛛 等 自动 化 程序 ,对 原 
狂 段 的 引用 不 得 超过 200 个 字符 等 。@ 仅 允许 利用 
年 于 台 容易 产生 华 断 。 不 允许 科研 人 员 利 用 自己 或 
第 三 方 的 研发 工具 ,不 利于 维护 学 术 自由 ,推动 科学 研 
究 ,提高 科研 效率 ,并 且 侵犯 了 科研 人 员 隐 私 权 。 国 
API 平台 技术 限制 侵犯 了 读者 合法 阅读 的 权利 。 信 息 
服务 机 构 认为 ,阅读 权 包括 挖 气 的 权利 ,既然 机 构 投 入 
大 量 经 费 购 入 相应 数据 库 资 源 ,就 应 该 为 读者 提供 不 
受 限制 的 挖掘 权 ™。 


3 ”域外 有 关 文 本 与 数据 挖掘 合理 使 用 的 
法 律 应 对 


3.1 美国 司法 

针对 TDM 行为 面临 的 版 权 困 境 问 题 ,美国 并 未 通 
过 单独 立法 予以 解决 ,而 是 通过 将 原则 性 合理 使 用 条 
款 应 用 到 司法 判例 实践 中 ,最 终 以 司法 个 案 形 式 确认 
T TDM 行为 的 合法 性 。2003 年 以 来 美国 法 院 在 多 个 


判决 中 认定 TDM 涉及 的 复制 行为 属于 合理 使 用 ” ， 
如 “Kelly 诉 Arriba Soft" 22 7: (2003) “Field YF Google" 
21%] (2006) ," Perfect 10 YRI” ZP” (2007) “A. 
V. jf iParadigms” 2e (2009) “作家 协会 诉 Google" 
4&7?! (2011) ," Fox Yf TVEyes" 327" (2014) ,“ White YẸ 
West" RPU (2014) “作家 协会 诉 HathiTrust" 887 
(2014) 等 ,其 中 以 “作家 协会 诉 Google” RA “VEK Hh 
会 诉 HathiTrust” 案 最 具 代 表 性 。 上 述 案例 中 ,美国 法 
院 借助 版 权 法 第 107 条 有 关 合 理 使 用 的 原则 性 条 款 ， 
尤其 是 引入 “转换 性 使 用 ”( transformative use ) 理论 ,对 
TDM 行为 进行 合理 使 用 “ 四 要 素 ” 分 析 , 从 而 推理 出 
TDM 行为 属于 合理 使 用 。 “转换 性 使 用 ”概念 最 早 由 
Leval 法 官 于 1990 年 提出 , 系 指 以 不 同 目的 或 不 同方 
式 对 作品 进行 创新 性 使 用 ” 。1994 年 在 Campbell v. 
Acuff-Rose Music 案件 中 转换 性 使 用 首次 在 司法 领域 
被 认定 为 合理 使 用 。 之 后 ,P.， Samuelson 在 上 述 案 
件 基 础 上 ,将 转换 性 使 用 细 分 为 3 种 类 型 .QD 在 评论 时 
利用 新 的 表达 方式 对 原 有 作品 进行 转换 ;@ 适 当 改 变 
原作 品 含义 或 所 传递 的 信息 ,从 而 在 原作 品 基 础 上 增 
加 了 新 的 内 容 ;加 基于 与 原 有 目的 相 区 别 的 其 他 目的 
使 用 原作 品 。 

在 “作家 协会 诉 Google" 案件 中 , Google 公司 开发 
“Google Books 项 目 ”, 即将 美国 大 学 图 书馆 提供 的 纸 
本 图 书 进 行 全 文 数字 化 扫描 ,利用 TDM 核心 技术 开发 
搜索 和 片段 浏览 功能 ,向 公众 提供 高 效 且 有 创新 性 的 
数字 化 检索 服务 。 具 体 而 言 ,Google 公司 将 扫描 后 的 
图 书 每 页 分 为 8 个 部 分 ,公众 输入 检索 词 后 则 呈现 少 
量 含有 检索 词 的 片段 ,这 实际 上 就 是 TDM 技术 的 应 
用 。2005 年 作家 协会 提起 对 Google 的 版 权 侵权 诉讼 ， 
2009 年 11 月 双方 达成 和 解 协议 ,Google 公司 被 允许 以 
默 示 许 可 方式 利用 版 权 作 品 ,但 后 被 法 院 和 否决 。2011 
年 11 月 纽约 南 区 地 方法 院 对 该 案 作出 初审 判决 ,认为 
“Google Books 项 目 " 具 有 很 强 的 转化 性 目的 一 一 为 公 
众 提供 完善 且 高 效 的 文字 搜索 服务 , 属于 合理 使 用 。 
2015 年 12 月 美国 第 二 巡回 法 院 维 持原 判 ,并 补充 到 : 
“具有 商业 僵 利 不 能 成 为 构成 否定 合理 使 用 的 绝对 标 
准 ; 且 片段 检索 模式 不 对 版 权 市 场 构成 奉 代 效果 ,不 会 
减损 权利 人 的 实质 利益 ”"。 在 “作家 协会 诉 
HathiTrust" 案件 中 , Hathitrust 数字 图 书馆 允许 公众 使 
用 特定 词语 在 其 机 构 库 中 的 全 部 数字 副本 中 进行 搜 
索 , 但 搜索 结果 只 显示 搜索 关键 词 所 在 的 页 码 以 及 在 
每 页 当中 显示 该 词语 的 频率 。 初 审 法 院 运 用 合理 使 用 
“四 要 素 ” 判 定 方法 ,认为 Hathitrust 数字 图 书馆 所 提供 
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的 检索 服务 不 属于 单纯 的 使 用 作品 ,属于 衍生 出 新 的 
学 术 研 究 方法 与 路 径 , 具 有 较 强 的 “转化 性 目的 ”™]。 
美国 第 二 巡回 法 院 亦 认为 Hathitrust 数字 图 书馆 实施 
TDM 行为 构成 合理 使 用 。 由 上 可 知 ,美国 法 院 从 司 
法 层面 最 大 程度 确认 了 TDM 行为 的 合法 性 ,属于 “无 
条 件 例外 ”模式 ,但 该 模式 适合 判例 法 国家 ,要 求法 官 
具备 充分 的 司法 经 验 ,需要 进行 个 案 判 断 ,效率 较 低 且 
成 本 较 高 。 
3.2 ”英国 立法 

2010 年 英国 政府 启动 了 对 版 权 制度 的 全 面 改 革 。 
2011 年 5 H I. Hargreaves 教授 受 英 国政 府 委 托 发 表 报 


3.3 欧盟 立法 

欧盟 于 1996 年 和 2001 年 分 别 颁布 的 《数据 库 保 
护 指令 》 和 《信息 社会 版 权 指令 》 由 于 其 著作 权 例 外 条 
款 采 用 封闭 式 立法 ,无 法 适用 于 TDM ,影响 了 TDM fX 
术 的 发 展 和 应 用 。 为 弥补 这 种 缺陷 并 进一步 推动 欧盟 
版 权 法 的 一 体 化 进程 ,欧盟 于 2016 年 发 布 《 数 字 单 
市 场 版 权 指令 提案 》, 明确 规 定 了 基于 科研 目的 的 
TDM 版 权 例 外 。2019 年 4 月 欧盟 正式 颁布 修改 后 的 
《数字 单一 市 场 版 权 指 令 》, 在 规定 “基于 科研 目的 的 
TDM 版 权 例外 "之 外 ,新 增 了 "基于 文本 与 数据 挖掘 目 
的 的 TDM 例外 ”。 指 令 第 3 条 第 1 款 明确 规定 ,成 员 


| 


告 4 数字 化 机 遇 : 知 识 产权 和 发 展 回顾 》5) ,针对 英国 


国 应 规定 出 于 科学 研究 目的 ,科研 机 构 和 文化 遗产 机 


现 有 知识 产权 立法 提出 10 项 建议 ,其 中 之 一 就 是 建议 
IgE LA. ME Ti IH PERDERE I TOM 行为 例外 。2014 年 英 
国 颁布 (版 权 和 表演 权 ( 研究 .教育 .图 书馆 和 档案 馆 ) 
ATP) ,在 (版权 .外 观 设 计 和 专利 法 》(1988) "中 
FIDA 条 ( 基于 非 商业 性 研究 的 文本 与 数据 挖 所 之 复 
D'SLA T. TDM 版 权 例外 。 该 条 款 主要 内 容 包括 :@ 
会 滤 获 取 作品 的 人 复制 版 权 作品 不 构成 侵权 ,只 要 满 


构 可 以 对 合法 获取 的 作品 或 其 他 内 容 进行 复制 与 提 
取 , 开 展 文本 和 数据 分 析 。 指 令 第 4 条 规定 ,成员 国 应 
规定 出 于 文本 与 数据 挖掘 目的 ,对 合法 获取 的 作品 或 
其 他 内 容 进行 复制 与 提取 的 行为 不 侵犯 版 权 。 

欧盟 针对 “基于 科研 目的 的 TDM 版权 例外 ”情形 ， 
规定 了 如 下 限制 条 件 :中 实施 TDM 的 主体 须 是 科研 机 
构 和 文化 遗产 机 构 。 科 研 机 构 是 指 大 学 (包括 其 图 书 
TR) .研究 所 或 其 他 主体 ,其 主要 目的 在 于 进行 科学 研 


算 缔 析 , 且 唯一 目的 是 出 于 非 商业 性 的 研究 ;其 二 , 复 
制 贰 附 有 充分 的 作者 信息 标示 (除非 因 实际 原因 或 其 
侍 吝 因 不 可 行 ) 。@ 若 未 经 版 权 所 有 人 允许 ,将 复制 件 
转 还 给 其 他 人 或 将 复制 件 用 于 非 商业 研究 以 外 的 目 
失物 成 侵权 。@@ 上 述 复制 件 若 被 出 售 或 出 租 或 者 提 
供出 售 或 出 租 , 则 该 复制 构成 侵权 。@ 文 本 与 数据 挖 
掘 例外 优先 于 合同 约定 效力 。 

加 由 前 可 知 ,英国 版 权 法 对 TDM 例外 适用 规定 了 3 
个 前 提 条 件 :被 复制 的 作品 须 为 通过 合法 途径 所 获 
取 。 这 意味 着 科研 人 员 只 有 其 本 人 或 所 在 机 构 已 经 购 
买 相关 资源 的 前 提 下 才能 对 版 权 作品 进行 数据 挖掘 和 
信息 分 析 , 否 则 构成 侵权 。@@ 复 制 目的 须 为 非 商业 性 
研究 目的 。 这 意味 着 任何 商业 性 的 TDM 所 涉及 的 复 
制 行为 必须 获得 作品 版 权 人 的 许可 ,否则 构成 侵权 。 
回复 制 需要 充分 标明 作品 的 作者 信息 。 这 意味 着 使 用 
人 须 尊重 版 权 人 人 身 权 , 未 充分 标示 作者 信息 构成 侵 
权 , 除 非 因 实际 原因 或 其 他 原因 不 可 行 。 英 国 版 权 法 
针对 TDM 例外 也 规定 了 相应 的 限制 条 件 , 即 禁止 将 复 
制 件 转让 给 其 他 人 ,或 将 复制 件 用 于 非 商业 研究 以 外 
的 目的 ,或 复制 件 被 用 于 “出 租 或 出 售 "。 值 得 肯定 的 
是 ,英国 版 权 法 规定 了 TDM 法 定 例外 优先 于 合同 约定 
效力 , 即 任何 旨 在 限制 或 阻止 TDM 所 涉及 复制 的 合同 
条 款 不 具有 执行 力 。 


究 或 与 科学 研究 相关 的 教学 性 活动 。 文 化 遗产 机 构 是 
指 可 供 公 众 访问 的 图 书馆 .博物馆 档案 馆 或 影音 遗产 
机 构 。@ 实 施 TDM 的 客体 须 是 合法 获取 的 作品 或 其 
他 内 容 。 来 源 合法 的 资源 包括 印刷 形式 和 电子 形式 ， 
即使 用 人 合法 获取 作品 或 其 他 内 容 的 纸 质 版 和 电子 
版 ,对 纸 质 材 料 进行 扫描 和 数字 化 ,对 电子 材料 进行 下 
载 等 。@) 实 施 TDM 的 目的 须 是 基于 科学 研究 目的 。 
欧盟 并 未 对 科学 研究 的 性 质 进行 明确 限制 ,研究 机 构 
与 商业 公司 合作 开展 的 科研 活动 , 仍 可 适用 此 例外 。 
不 过 ,此 例外 虽然 将 商业 性 研究 目的 涵盖 在 内 ,但 有 一 
定 条 件 限 制 一 一 研究 机 构 应 将 所 获 利 润 继续 投入 其 科 
学 研究 中 ,并 且 对 该 机 构 具 有 决定 性 影响 的 企业 不 能 
优先 获取 相关 研究 成 果 。@ 实 施 TDM 的 使 用 方式 限 
于 “复制 "和 “提取 ”。 对 于 “改编 “翻译 ”汇编 ”等 类 
型 是 否 适用 此 例外 ,欧盟 并 未 明确 说明 。 名 实施 TOM 
的 挖掘 结果 应 以 适当 的 安全 等 级 存储 。 欧 盟 要 求 存 储 
达到 一 定 的 安全 等 级 ,以 防止 使 用 人 滥用 TDM 例外 ， 
保障 权利 人 的 合法 权益 。 

考虑 到 “基于 科研 目的 的 TDM 版 权 例 外 ”受到 较 
多 限制 ,无 法 广泛 应 用 于 科研 以 外 领域 的 TDM 应 用 
《如 复杂 的 商业 决策 ,政府 服务 或 新 应 用 程序 或 科技 的 
发 展 等 ) ,加 之 TDM 分 析 行 为 不 属于 欧盟 于 《2001 年 
版 权 指令 》 明 确 规定 属于 “合理 使 用 ”的 临时 复制 情 
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形 ,欧盟 新 增 了 “基于 文本 与 数据 挖掘 目的 的 TDM 例 
外 ”情形 。 该 例外 适用 要 求 是 一 一 只 要 权利 人 没有 以 
适当 方式 明确 保留 对 相关 内 容 的 使 用 , 则 使 用 者 可 对 
合法 获取 的 内 容 进行 复制 与 提取 ,没有 主体 资格 (不 限 
于 科研 机 构 ) 使 用 目的 (不 限于 非 营利 目的 ) 的 限制 ， 
以 更 好 鼓励 私人 企业 进行 创新 。 
3.4 日 本 立法 
2009 年 日 本 修正 版 权 法 ,在 版 权 法 第 47 条 之 七 中 
引入 了 “为 解析 信息 进行 的 复制 等 "著作 权 例 外 ,该 
条 一 般 被 视 为 TDM 著作 权 例外 。 依 据 该 条 规定 ,基于 
通过 计算 机 进行 信息 分 析 (是 指 从 众多 作品 及 其 他 大 
量 信息 中 ,提取 构成 该 信息 的 语言 .声音 .影像 或 其 他 
要 素 ,并 进行 比较 .分 类 及 其 他 统计 分 析 ) 之 目的 情形 ， 
在 必要 限度 内 ,可 以 将 作品 录入 记录 媒介 或 进行 收编 
但 海 了 供 信息 分 析 者 使 用 制作 的 数据 库 作品 ,不 在 此 
限 洒 日 本 的 “信息 解析 例外 "为 TDM 行为 提供 了 较 好 
钱 法 性 依据 ,具有 进步 意义 。 该 例外 条 款 特点 如 下 : 
G9 通用 对 象 不 限于 文本 ,还 包括 语言 .影像 声音 或 其 
他 要 素 ,但 专用 于 信息 解析 的 数据 库 作 品 除外 ;@) 使 用 
各 不 限于 某 一 特定 数据 分 析 方 法 ,还 将 比较 .分 类 或 
其 他 统计 分 析 等 方法 涵盖 在 内 ;@@ 使 用 方式 不 限于 复 
制 E 还 包括 改编 ,也 就 是 说 依据 该 作品 创作 出 的 衍生 作 
品 交 复制 也 可 适用 该 例外 。 当 然 ,也 必须 指出 ,日 本 的 
“信息 解析 例外 ”也 有 一 定局 限 性 ,如 将 信息 解析 工具 


局 限于 计算 机 ,过 于 局 限于 现 有 技术 ,忽略 了 随 着 新 技 
术 发 展 将 来 计算 机 之 外 其 他 先进 设备 设施 应 用 的 可 能 
3:85 德国 立法 

2017 年 9 月 德国 颁布 了 《著作 权 因 应 知识 社会 发 
展 需要 法 案 》” ,对 著作 权 法 进行 修正 ,该 法 案 重 构 了 
基于 教育 与 科学 目的 对 著作 权 人 权利 进行 限制 的 体 
系 ,其 中 包括 引入 了 文本 与 数据 挖掘 例外 以 及 规定 了 
法 律 许可 使 用 和 合同 授权 使 用 的 关系 ,以 试图 解决 德 
国 著作 权 法 被 批评 为 无 法 适应 新 技术 变化 以 及 复杂 的 
结构 让 外 行人 难以 理解 的 问题 。 德 国 著作 权 法 第 
60d 条 为 文本 与 数据 挖掘 条 款 ,该 条 第 1 款 规定 :为 基 
于 科学 研究 对 大 量 作为 材料 来 源 的 作品 进行 自动 分 
析 , 应 允许 使 用 者 出 于 非 商业 目的 以 系统 和 自动 等 方 
式 复制 来 源 材料 ,并 通过 规范 化 ,结构 化 和 分 类 化 的 方 
法 创建 一 个 可 用 于 分 析 的 语料库 ;这 些 语料库 可 以 向 
特定 有 限 的 合作 开展 科学 研究 的 人 群 以 及 负责 监测 科 
学 研究 质量 的 独立 的 第 三 方 公开 。 该 条 第 2 款 规定 依 
据 第 1 款 对 数据 库 作品 进行 TDM 利用 构成 惯常 利用 ， 


— 


奉 对 数据 库 作品 的 非 实质 性 内 容 进行 利用 视 为 对 数据 
库 的 正常 利用 。 该 条 第 3 款 规定 研究 工作 完成 后 原始 
资料 的 语料库 和 复制 件 应 被 允许 传送 给 图 书馆 、 档 案 
TR .博物馆 及 教育 机 构 进行 长 期 保存 。 由 上 可 知 ,德国 
AR TDM 行为 构成 合理 使 用 的 适用 条 件 如 下 :中 使 用 
主体 不 限定 于 某 类 特定 主体 (如 科研 机 构 或 文化 遗产 
机 构 等 ) ,并 将 商业 性 机 构 ( 从 事 非 商业 性 研究 ) 涵盖 
在 内 ;人 @ 使 用 目的 限定 为 非 商业 性 的 科学 研究 ;@ 使 用 
对 象 不 限定 于 合法 来 源 的 作品 ,并 将 数据 库 作品 也 涵 
盖 在 内 ;@ 岂 使 用 行为 包括 创建 用 于 分 析 的 语料库 以 及 
该 语料库 向 特定 科研 人 员 或 负责 检测 科研 质量 的 第 三 
方 公 开 这 两 种 豁免 情形 ;@) 与 TDM 相关 的 资料 可 传送 
给 图 书馆 等 公共 机 构 进行 长 期 保存 。 


4 我 国文 本 与 数据 挖掘 合理 使 用 规则 的 
设计 思路 


2020 年 11 月 颁布 的 新 《著作 权 法 》 第 24 条 增加 
了 第 十 三 项 “法 律 \ 行 政法 规 规定 的 其 他 情形 "这 项 合 
理 使 用 忽 底 法 律 条 球 ,为 我 国 TDM 行为 被 认定 为 合理 
使 用 提供 了 一 定 的 法 律 空间 。 但 考虑 到 该 项 规定 的 模 
糊 性 ,TDM 需求 的 广泛 性 以 及 我 国 成 文法 的 传统 , 笔 
者 建议 在 著作 权 法 中 专 设 TDM 版 权 例 外 条 款 。 借 鉴 
国外 新 近 立 法 经 验 ,结合 我 国 实际 ,建议 TDM 合理 使 
规则 设计 应 主要 包括 如 下 内 容 : 
4.1 TDM 例外 的 主体 条 件 

欧盟 2019 年 《数字 单一 市 场 版 权 指令 》 尽 管 未 限 
定 基于 文本 与 数据 挖掘 目的 TDM 例外 的 主体 资格 ,但 
将 基于 科研 目的 TDM 例外 主体 限定 为 科研 机 构 和 文 
化 遗产 机 构 。 而 美国 英国 日本、 德国 ,法国 等 国家 并 
未 限定 TDM 合理 使 用 行为 的 主体 条 件 ,商业 性 公司 也 
可 成 为 TDM 合理 使 用 行为 的 主体 。 笔 者 建议 TDM 合 
理 使 用 行为 的 适用 主体 应 不 仅 限于 科研 机 构 或 公共 文 
化 机 构 ,理由 如 下 :中 限定 主体 将 无 法 充分 利用 TDM 
技术 。 随 着 技术 不 断 发 展 , 更 善于 应 对 市 场 变化 的 互 
联网 或 软件 公司 在 TDM 领域 研究 能 力 往往 要 强 于 研 
究 机 构 或 文化 遗产 机 构 , 许 多 公共 文化 机 构 仅 靠 自身 
力量 无 法 单独 完成 TDM, 需 要 与 相关 科技 公司 合 
TE ,因此 若 将 主体 限定 为 科研 机 构 或 公共 文化 机 
构 ,将 不 利于 TDM 技术 的 充分 应 用 和 发 展 。 包 限定 主 
体 将 损害 公民 个 人 研究 自由 。 将 企业 或 个 人 完全 排除 
成 为 TDM 合理 使 用 行为 的 主体 ,损害 了 我 国 宪法 所 保 
护 的 公民 具有 科学 研究 、 文 学 艺术 创作 和 其 他 文化 活 
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动 的 自由 ,破坏 了 人 们 认识 事物 规律 的 所 应 具有 的 平 
等 机 会 。@ 限 定 主体 将 损害 社会 公共 利益 。 限 定 科 研 
机 构 或 公共 文化 机 构 将 阻 却 其 他 主体 通过 公布 TDM 
结果 为 公益 事业 作 贡 献 的 动机 ,不 利于 推进 商业 性 
主体 积极 参与 公益 性 活动 。 
4.2 TDM 例外 的 客体 条 件 
TDM 例外 的 客体 是 否 强 制 性 要 求 具备 合法 来 源 ? 
各 国 规定 不 尽 相 同 。 部 分 国家 如 美国 德国、 日 本 等 并 
不 将 被 挖掘 对 象 的 来 源 合 法 性 作为 前 置 性 条 件 , 但 也 
有 部 分 国家 如 欧盟 、 英 国 、 法 国 等 将 TDM 例外 客体 条 
件 限定 为 合法 获取 (lawful access ) 的 作品 。 合 法 获取 
一 般 是 指 通过 订阅 图 书 期 刊 . 购 买 数 据 库 或 遵守 开放 
许可 协议 等 多 种 途径 依法 获取 作品 的 权利 。 欧 盟 《 数 
秆 单一 市 场 版 权 指 令 ) 序 言 第 14 条 指出 ,合法 获取 应 
理 候 为 包括 依据 开放 获取 政策 ,或 根据 机 构 与 权利 人 
关 疗 的 合同 安排 ， 或 通过 其 他 合法 手段 获取 内 容 , 或 对 
在 可 免费 获取 的 内 容 ( 权 利 人 并 未 以 适 当 方 式 对 其 复 
制 各 作出 保留 ) 进 行 访问 。 英国 政府 公开 的 文件 明确 
fau. 合法 获取 是 指 依法 享有 获取 作品 的 权利 ,订阅 图 
5 基 刊 或 数据 库 以 及 遵守 合同 协议 等 均 为 合法 获取 的 
。 笔 者 认为 ,考虑 到 判定 被 挖 据 对象 是 否 具 有 
来源 ,需要 较 大 的 时 间 和 经 费 成 本 ,并 且 从 促进 
TOA 新 技术 应 用 和 发 展 以 及 维护 公共 利益 角度 出 发 ， 
33t TDM 例外 的 客体 应 不 限定 为 合法 来 源 。 对 此 问 
斯 . 普 朗 克 创新 与 竞争 研究 所 也 建议 科研 机 
性 没有 合法 接触 权 的 情况 下 应 有 权 实施 TDM ,但 使 
Ee ^o BEP, TDM 合理 使 
用 两 则 是 否 适用 于 未 发 表 作 品 ” 有 学 者 明确 提出 和 否 
但 笔者 认为 ,尽管 未 发 表 作 品 属 于 作者 
绝对 控制 范围 ,但 从 促进 知识 传播 .保障 公众 对 作品 接 
近视 角 看 ,法 律 应 认可 对 未 发 表 作品 的 合理 使 用 ”1 ， 
尤其 是 对 收藏 了 许多 具有 重要 史料 价值 和 研究 价值 的 
珍贵 手稿 日记 、 往 来 信件 .电报 等 资源 的 图 书馆 或 档 
案 馆 而 言 ,对 这 些 未 发 表 作品 进行 TDM 属于 生产 性 使 
用 行为 而 非 消 费 性 使 用 行为 ,具有 很 强 的 公益 性 。 综 
上 所 述 ,TDM 例外 的 客体 要 求 不 应 做 任何 限制 ,不 限 
制 于 合法 来 源 或 已 发 表 作 品 , 但 可 要 求 使 用 人 为 非 合 
法 来 源 的 作品 利用 支付 合理 的 许可 费 。 
4.3 TDM 例外 的 目的 条 件 
英国 将 TDM 构成 合理 使 用 的 目的 限定 为 非 营 利 
或 非 商 业 性 目的 。 欧 盟 则 对 TDM 目的 条 件 规 定 了 更 
为 宽松 的 要 求 。 针 对 “基于 科研 目的 的 TDM 版 权 例 
外 ”情形 ,欧盟 将 科研 目的 作为 限定 条 件 ,但 将 商业 性 


研究 目的 涵盖 在 内 ,不 过 要 求 研究 机 构 应 将 所 获 利润 
继续 投入 其 科学 研究 中 ;针对 “基于 文本 与 数据 挖 据 目 
的 的 TDM 例外 "情形 ,欧盟 并 未 做 相应 的 目的 上 的 限 
制 ,以 更 好 推动 TDM 技术 在 科研 以 外 领域 的 应 用 和 发 
展 。 美 国 通过 合理 使 用 四 要 素来 判定 TDM 是 否 构成 
合理 使 用 ,美国 第 二 巡回 法 院 就 Google 数字 图 书馆 案 
件 明确 指出 :具有 商业 醒 利 不 能 成 为 构成 否定 合理 合 
oe 日 本 立法 也 并 未 明确 限定 TDM 的 目 

条 件 。 综 合 主要 国家 立法 情况 ,笔者 建议 我 国 TDM 
ee ee um 
理 目的 ” ,理由 如 下 :与 非 商 业 性 目的 相 比 ,科学 研究 
所 涵盖 范围 更 广 ,包括 非 商业 性 研究 和 商业 性 研究 。 
科学 研究 具有 公共 利益 的 本 质 属性 ,TDM 所 产生 的 新 
作品 并 不 会 对 原作 品 构成 实质 性 蔡 代 ,TDM 行为 本 身 
并 不 会 损害 权利 人 利益 ,商业 性 科学 研究 具有 存在 的 
价值 。@ 增 加 * 其 他 合理 目的 "表述 ,为 TDM 在 其 他 领 
域 应 用 以 更 好 实现 公共 利益 提供 保障 。TDM 作为 一 
项 新 的 数据 分 析 技术 ,在 科学 研究 以 外 的 其 他 领域 ,如 
商业 重大 决策 .政府 服务 (如 公共 健康 风险 评估 与 决 
策 .食品 安全 监管 与 控制 等 中 ) .新 技术 或 程序 开发 等 
领域 都 有 重要 应 用 价值 。 
4.4 TDM 例外 的 行为 条 件 

TDM 的 利用 行为 一 般 包括 “复制 “提取 ”(“ 改 
编 ") “传播 "等 方式 。 各 国 针 对 TDM 例外 的 适用 行为 
规定 具有 差异 性 。 如 英国 规定 TOM 例外 适用 行为 限 
于 复制 ,欧盟 将 其 限于 复制 和 提取 ,日 本 规定 限于 复制 
和 改编 。 德 国 则 规定 复制 和 传播 ,但 传播 限于 两 类 特 
定 对 象 (特定 科研 人 员 或 检测 科研 质量 的 第 三 方 ) 。 
美国 比较 特殊 ,由 于 其 暂时 没有 针对 TDM 例外 行为 的 
专门 立法 ,但 通过 相关 司法 案例 可 知 , 美 国法 院 一 般 将 
TDM 例外 的 行为 限定 于 复制 和 有 限 传播 (不 构成 对 原 
作品 的 实质 性 替代 ) 。 如 在 Google 数字 图 书馆 案件 
中 ,法 院 认为 Google 对 原作 品 的 片段 式 呈现 (传播 的 
表现 形式 ) 不 足以 取代 原作 品 ,构成 合理 使 用 ;但 在 
TVEyes 案件 中 ,2018 年 第 二 巡回 法 院 推翻 了 2014 年 
地 方法 院 做 出 的 被 告 对 原作 品 的 片段 呈现 构成 合理 使 
用 的 结论 ,认为 被 告 为 用 户 提供 不 超过 十 分 钟 的 片段 
式 浏览 服务 ,用 户 可 通过 这 些 片段 了 解 原作 品 的 核心 
思想 ,该 片段 已 对 原作 品 构成 了 市 场 威胁 ,不 属于 合理 
使 用 。 综 上 所 述 ,考虑 到 复制 和 提取 或 改编 是 文本 与 
数据 控 气 应 用 中 最 基础 和 必 不 可 少 的 环节 ,而 且 * 传 
播 "行为 若 完全 禁止 不 符合 公共 利益 ,因此 笔者 建议 
TDM 例外 行为 方式 包括 “复制 "“ 提 取 或 改编 "以 及 
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“有 限 传播 ”( 面向 科研 人 员 等 特定 对 象 进行 传播 或 面 
向 公众 传播 时 传播 内 容 不 足以 替代 原作 品 ) 。 
4.5 TDM 例外 的 其 他 条 件 

TOM 例外 的 其 他 条 件 包括 以 下 内 容 :@D 安 全 保存 
措施 。TDM 挖 气 结 果 需 要 安全 地 存储 ,以 供 后 续 的 数 
据 分 析 或 对 分 析 结 果 进 行 验证 。 许 多 国家 立法 例 都 严 
格 规定 了 TDM 的 后 续 存储 行为 ,值得 我 国 借鉴 。 如 欧 
盟 规定 为 实施 TDM 的 作品 复 本 应 以 适当 的 安全 等 级 
存储 ,以 用 于 科学 研究 或 验证 研究 结果 。 德 国 规定 研 
究 完成 后 应 删除 原始 资料 的 语料库 和 复制 品 ,不 再 向 
公众 开放 ,但 允许 将 其 交 由 图 书馆 、 档 案 馆 ,博物 馆 和 
教育 机 构 长 期 存储 。 在 美国 Google 数字 图 书馆 案 中 ， 
Google 重点 证 明 其 采取 了 严格 的 安全 保存 措施 ,以 防 
1 数字 图 书 外 汇 和 传播 。@ 技 术 措施 规避 例外 。 数 字 
时 从 越 来 越 多 人 采取 技术 措施 对 其 作品 进行 保护 ,车 
许 使 用 人 可 以 合法 规避 技术 措施 ,那么 TDM 行为 
法 实施 。 从 全 球 立法 来 看 ,许多 国家 都 规定 了 多 
项 颖 术 措施 规避 法 定 例外 情形 ,尤其 是 将 图 书馆 、 档 案 
馆 等 机 构 作为 技术 措施 规避 例外 的 主体 ,如 美国 法 
国 s 德 国 \ 澳 大 利 亚 等 ,这 在 一 定 程度 上 有 利于 公共 机 
ISG TDM。 但 也 须 指出 ,上 述 法 定 例外 还 不 能 完全 
WD TDM 的 应 用 和 发 展 需要 , 故 一 些 地 区 或 国家 专 站 
座 注 规定 技术 保护 措施 不 应 妨碍 TDM 的 实施 。 如 欧 
盟 & 数字 化 单一 市 场 版 权 指令 ) 第 3 条 第 3 款 规 定 :“ 权 
种 天 可 采取 措施 确保 承载 作品 或 其 他 受 版 权 保 护 内 容 
的 网 络 和 数据 库 的 安全 性 和 完整 性 ,但 该 措施 不 应 超 
过 实现 这 一 目标 所 必需 的 限度 ” ,马克 斯 普 朗 克 创新 
与 缉 争 研究 所 也 建议 权利 人 所 采取 的 必要 技术 保护 措 
施 不 得 不 必要 地 妨碍 文本 与 数据 挖掘 ”” 。 就 我 国 而 
言 ,2020 年 新 修订 的 《著作 权 法 》 仅 规定 了 技术 措施 规 
避 例 外 的 5 种 法 定 情形 一 一 为 课堂 教学 或 科学 研究 、 
为 盲人 利益 .执行 公务 ,安全 测试 以 及 加 密 或 反 向 工程 
研究 ,甚至 都 没有 规定 图 书馆 等 机 构 作 为 合法 规避 技 
术 措施 的 主体 地 位 ,这 远 不 能 满足 文本 与 数据 挖掘 需 
要 ,故我 国 尤 其 需要 规定 针对 TOM 的 技术 措施 规避 例 
外 条 款 。@@ 优 先 于 合同 约定 条 款 。 为 避免 数据 库 商 等 
权利 人 利用 其 垄断 地 位 借助 合同 协议 区 断 条 款 来 排除 
TDM 的 应 用 ,我 国有 必要 通过 立法 规定 任何 排除 TDM 
的 合同 条 款 都 属于 无 效 约定 ,如 英国 (版 权 、 外 观 设计 
和 专利 法 ) 第 29A 条 第 5 款 、 德 国 《著作 权 和 邻接 权 
法 ) 第 60g 条 第 1 款 作 了 类 似 规定 。 轩 充分 标注 版 权 
人 信息 。 英 国 规定 为 实施 TDM 所 进行 的 复制 需要 充 
分 标明 作品 的 作者 信息 ,除非 标注 不 具有 可 行 性 ,如 对 
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分 散 的 文本 和 数据 进行 标注 。 同 时 对 TDM 之 目的 、 发 
生 和 结束 之 时 间 和 地 点 以 及 TDM 之 客体 等 以 书面 或 
电子 形式 进行 充分 说 明 ,除非 涉及 到 国家 安全 、 紧 急 状 
态 等 特殊 情形 “。@ 挖 气 结 果 的 使 用 。 建 议 规定 
TDM 结果 可 以 免费 公开 ,但 受到 一 定 条 件 限制 ,如 公 
开 不 具备 商业 目的 ,不 得 未 经 权利 人 许可 私下 转让 ,不 
得 进行 相关 交易 行为 (出 售 或 出 租 ,或 许诺 出 售 或 出 
租 ,或 为 出 售 .出 租 而 披露 ) 等 。 

综 上 所 述 ,本文 建议 我 国 TDM 合理 使 用 规则 主要 
内 容 为 :四 包括 科研 机 构 、 公 共 文 化 机 构 、 商 业 性 机 构 
以 及 其 他 组 织 在 内 的 任何 机 构 或 个 人 基于 科学 研究 或 
其 他 合理 目的 对 作品 以 复制 、 提 取 改编 或 有 限 传播 方 
式 进 行文 本 和 数据 挖 气 , 无 需 著作 权 人 许可 ,不 向 其 文 
付 报酬 ,但 应 当 指 明 作者 姓名 或 者 名 称 、 作 品名 称 ,并 
且 不 得 影响 该 作品 的 正常 使 用 ,也 不 得 不 合理 地 损害 
著作 权 人 的 合法 权益 。@ 上 述 文 本 和 数据 挖掘 行为 可 
以 避 开 技术 措施 ,但 不 得 向 他 人 提供 避 开 技术 措施 的 
技术 ,装置 或 部 件 ,不 得 侵犯 权利 人 依法 享有 的 其 他 权 
利 ;不 禁止 使 用 人 利用 非 合 法 来 源 作品 ,但 须 支 付 合 理 
的 许可 费 ; 文 本 和 数据 挖掘 结果 应 被 安全 地 存储 ,并 可 
基于 非 商业 目的 在 不 损害 权利 人 利益 的 前 提 下 向 公众 
公开 ;任何 旨 在 阻止 或 限制 依据 本 条 款 所 允许 利用 行 
为 的 合同 协议 是 无 效 的 。 
参考 文献 : 


[ 1 ] UK Intellectual Property Office. Guidance of exceptions to copy- 
right[ EB/OL ]. [2021 - 04 - 13 ]. https;//www. gov. uk/guid- 


T 


ance/exceptions-to-copyright # text-and-data-mining-for-non-com- 
mercial-research. 

[ 2 ] The European Union. Directive ( EU) 2019/790 of the European 
Parliament and of the Council of 17 April 2019 on copyright and 
related rights in the digital single market and amending directives 
96/9/EC and 2001/29/EC ( Text with EEA relevance. ) [ EB/ 
OL]. [2021 - 04 - 13 ]. https;//eur-lex. europa. eu/legal-con- 
tent/EN/TXT/? uri = uriserv: OJ. L_. 2019. 130. 01. 0092. 01. 
ENC. 


[3] BORGHI M, KARAPAPA S. Copyright and mass digitization: a 


La 


cross-jurisdictional perspective[ M]. New York: Oxford University 
Press ,2013. 

[ 4 ] 王 迁 . 著作 权 法 [LM] . 北京: 中 国人 民 大 学 出 版 社 ,2015. 

[ 5 ] The European Union. Directive 96/9/EC of the European Parlia- 


ment and of the Council of 11 March 1996 on the legal protection of 
databases [ EB/OL ]. [2021 — 04 - 13 ]. https;//wipolex. wipo. 
int/zh/text/126788. 
[ 6 ] 董 凡 , 关 永 红 . 论文 本 与 数字 挖掘 技术 应 用 的 版 权 例外 规则 构 
建 [ 相 .河北 法 学 ,2019 ,37(9) :148 -160. 


11 


&Q 54i xt 


$865 35 5822 Hg. 2021 5E 11 月 


ChinaXiv& fERBTII 


[ 7 ] Authors Guild v. Google, Inc. , 804 F. 3d 202 (2nd Cir. 2015) 
[ EB/OL]. [2021 -04 - 13 ]. https ;//www. lexisnexis. com/. 

[ 8 ] Authors Gulid,Inc. v. Hathitrust,755F, 3d. 87 (2nd Cir. 2014) 
[ EB/OL]. [2021 - 04 - 13 ]. https ;//www. lexisnexis. com/. 

[9 ] Fox News Network, LLC v. TVEyes, Inc. , 883 F.3d 169 (2nd 
Cir. 2018) [EB/OL ]. [2021 -04 - 13 ]. https //www. lexisnex- 
is. con. 

[10] The European Union. Directive 2001/29/EC of the European Par- 
liament and of the Council of 22 May 2001 on the harmonisation of 
certain aspects of copyright and related rights in the information so- 
ciety[ EB/OL ]. [2021 - 04 — 13]. https://www. wipo. int/ 
edocs/lexdocs/ laws/ en/ eu/eu049 en. pdf. 

[11 ]ROSATI E. Copyright as an obstacle or an enabler? a European per- 
spective on text and data mining and its role in the development of 
AT creativity[ J]. Asia Pacific law review, 2019,27 (2); 198 — 

qum217. 

[12] European Commission. Licences for Europe stakeholder dialogue- 

quy fremently asked questions| EB/OL]. [2021 -04 — 13]. https:// 


» 


epe. europa. eu/commission/ presscorner/detail/en/MEMO _ 13 _ 
(3986. 

[ Tac di ios BS SE, ERG. E D tb M s SC RH RR 0 
ST ipti L1]. 图 书馆 建设 ,2016(7) :27 - 33. 

[ Ten things to know about text mining and the proposed copyright di- 
CNeeiv COM (2016) 593final[ EB/OL ]. [2021 - 04 - 13 ]. ht- 
Cips ://www. stm-assoc. org/2016. _11 24. 2016. 11. STM, Ten. 


C Nibings to. know. about, TDM. and. proposed. copyright, directive. 
pdt. 

[Eprex and data mining[ EB/OL]. [2021 -04 -13]. https://www. 

(gcrossref . org/education/ retrieve-metadata/ rest-api/text-and-data- 
C mining. 
LIEF How does Elsevier’ s text mining policy work with new UK TDM 
Claw? [EB/OL]. [2021 -04 - 13]. https://www. elsevier. com/ 
connect/how-does-elseviers-text-mining-policy-work-with-new-uk- 
tdm-law. 

[17] Intellectual property office. Exceptions to coyright : research ( 2014 ) 
[ EB/OL]. [2021 -04 —13]. https;//assets. publishing. service. 
gov. uk/government/uploads/system/uploads/attachment _ data/ 
file/375954/Research. pdf. 

[18] Elsevier provisions for text and data mining ( TDM ) [ EB/OL J. 
[2021 -04 - 13]. https://www. elsevier. com/.. data/assets/pdf 
 file/0012/102234/ TDM-sign-up-short-form. pdf. 

[19] Springer partners with copyright clearance center to power text and 
data mining solution[ EB/OL]. [2021 204 — 13]. http://www. 
copyright. com/springer-partners-with-copyright-clearance-center- 
to-power-text-and-data-mining-solution/ . 

[20] Springer Nature TDM policy [ EB/OL]. [2021 — 04 - 13]. ht- 
tps:;//www.  springernature. com/gp/researchers/text-and-data- 
mining. 


[21] IFLA statement on text and data mining| EB/OL ]. [2021 - 04 - 


13]. https://www. ifla. org/publications/node/8225. 

[22]LIBER. The hague declaration on knowledge discovery in the digital 
age[ EB/OL]. [2021 — 04 — 13]. https ;//thehaguedeclaration. 
com/ wp-content/uploads/sites/2/2015/04/ Liber. DeclarationA4 _ 
2015. pdf. 

[23 ] LIBER calls on elsevier to withdraw TDM policy [ EB/OL]. [2021 
-04 -13]. https ://libereurope. eu/article/liber-calls-on-elsevi- 
er-to-withdraw-tdm-policy/ 

[24] 罗 娇 ,张晓林 . 支持 文本 与 数据 挖掘 的 著作 权 法 律 政策 建议 

[J]. 中 国 图 书馆 学 报 ,2018 ,44(3 ) :21 -34. 

[25] Kelly vs. Arriba Soft,336F. 3D 811(9th Cir. 2003) [ EB/OL ]. 

[2021 -04 - 13 ]. https ://www. lexisnexis. com/. 

[26] Field vs. Google, 412 F. Supp. 2d 1106 (2006) [ EB/OL]. [2021 


— 04 -13 ]. https ;//www. lexisnexis. com/. 

[27] Perfect 10 vs. Amazon, 508 F. 3d 1146 (9th Cir. 2007) [ EB/ 

OL]. [2021 -04 - 13]. https ;//www. lexisnexis. com/. 

[28] A. V. v. iParadigms, LLC, 562 F. 3d 630,634 (4th Cir. 2009) 

[ EB/OL]. [2021 -04 — 13 ]. https;//www. lexisnexis. com/. 

[29] Authors Guild v. Google,770F. Supp. 2d 666 (2011) [ EB/OL ]. 

[2021 - 04 —13]. https;//www. lexisnexis. com/. 

[30] Fox News Network, LLC v. TVEyes, Inc. , 43 F. Supp. 3d 379 
(2014) [ EB/OL]. [2021 — 04 — 13 ]. https // www. lexisnexis. 
com/. 

[31] White v. West Publ’ g Corp. , 29 F. Supp. 3d 396 (2014) [ EB/ 
OL]. [2021 -04 — 13]. https ;//www. lexisnexis. com/. 

[32] Authors Guild, Inc. v. HathiTrust, 755 F. 3d 87 (2nd Cir. 
2014) [ EB/OL ]. [2021 - 04 - 13 ]. https://www. lexisnexis. 
com/. 

[33] LEVAL P. Toward a fair use standard [ J]. Harvard law review, 

1990, 103(5) :1105 - 1136. 

[34] Campbell v. Acuff-Rose Music, Inc. , 510 U. S. 569(1994) [ EB/ 

OL]. [2021 -04 - 13]. https;//www. lexisnexis. com/. 

[35] SAMUELSON P. Possible futures of fair use[ EB/OL ]. [2021 -04 

— 13 ]. https ;//ssrn. com/ abstract = 2584180. 

[36] Authors Gulid, Inc. v. Google, Inc. 804F. 3d 202 (2nd Cir. 
2015) [ EB/OL ]. [2021 - 04 - 13 ]. https://www. lexisnexis. 
com/. 

[37] Authors Guild, Inc. v. Hathitrust, 902 F. Supp. 2d 445(2012) 

[ EB/OL]. [2021 -04 — 13 ]. https;//www. lexisnexis. com/. 

Authors Guild v. Hathitrust, 755F. 3d. 87 (2nd Cir. 2014) [ EB/ 

OL]. [2021 -04 — 13]. https ;//www. lexisnexis. com/. 

[39] HARGREAVES I. Digital opportunity :a review of intellectual prop- 
erty and growth[ EB/OL]. [2021 -04 —13]. https://www. gov. 

data/file/ 


[38 


i 


uk/government/uploads/ system/uploads/attachment _ 
32563/ipreview-finalreport. pdf. 

[40] The copyright and rights in performances ( research , education, li- 
braries and archives) regulations| EB/OL]. [2021 — 04 - 13 ]. ht- 
tps :;// www. legislation. gov. uk/uksi/2014/1372/ contents/made. 

[41] The copyright, designs and patents act 1988[ EB/OL]. [2021 -04 


12 


ChinaXiv 合 作 期 刊 


吴 高 , 黄 晓 斌 .人工 智能 时 代 文 本 与 数据 挖掘 合理 使 用 规则 设计 研究 [了 .图书 情报 工作 ,2021 ,65(22) :3 - 13. 


—13]. https://wipolex. wipo. int/en/legislation/ details/18023. 
[42] 日 本 知识 产权 法 [M]. 杨 和 义 , 译 . 北京 :北京 大 学 出 版 社 ， 
2014. 
[43 ] Act on the harmonization of the copyright law with the current re- 
quirements of the knowledge society (copyright knowledge society 


act) | EB/OL]. [2021 - 04 - 13 ]. https://wipolex. wipo. int/en/ 


[48] Max Planck institute for innovation & competition. Position state- 
ment of the Max Planck institute for innovation and competition on 
the proposed modernisation of European copyright rules part b ex- 
ceptions and limitations ( Art. 3-Text and data mining) [ EB/OL ] . 


[2021 - 04 - 13]. 
2383669 8/component/file 2409840/ content. 


https;//pure. mpg. de/rest/items/item _ 


legislation/details/18029. [49 ] 唐 思 慧 . 大 数据 环境 下 文本 和 数据 挖掘 的 版 权 例外 研究 一 一 

[44] German reform on the use of copyright protected works in the fields 欧盟 《DSM 版 权 指令 》 提 案 为 视角 [站 .知识 产权 ,2017(10): 
of education and research will come into force soon [ EB/OL ]. 109 - 116. 
[2021 -04 - 13]. http://copyrightblog. kluweriplaw. com/2018/ [50] 董 凡 , 关 永 红 . 论文 本 与 数字 挖掘 技术 应 用 的 版 权 例外 规则 构 
01/15/german-reform-use-copyright-protected-works-fields-educa- 建 [ 相 .河北 法 学 ,2019 ,37(09) :148 - 160. 
tion-research-will-come-force-soon/ . [51] 梁 志文 . 我 国 著作 权 法 上 未 发 表 作 品 的 合理 使 用 及 其 立法 模式 


[45] 王 文 敏 ,高 军 人 工 智能 时 代 图 书馆 信息 分 析 的 著作 权 例 外 规 
则 [J] .图 书馆 论坛 ,2020 ,40(9) :60 -68. 

[46] Af. 文本 与 数据 挖掘 的 版 权 例外 一 一 以 欧盟 版 权 指令 修改 

SEN UB L1] 电子 知识 产权 ,2017(6) :42 -51. 

[47 UK intellectual property office. Exceptions to copyright; research 作者 贡献 说 明 : 

EB/OL].[2021 -04 - 13]. https://www. gov. uk/guidance/ 


[站 .法 学 ,2008(3):101 - 108. 
[52] 赵 力 .《 数 字 时 代 知 识 发 现 海 牙 宣 言 ) 之 借鉴 一 一 以 内 容 挖 气 
ABO LJ]. 图 书馆 ,2015(9) :22 - 26. 


吴 高 :负责 论文 初稿 撰写 ,修改 论文 
黄 晓 斌 :负责 论文 修改 及 内 容 补 充 。 


xceptions-to-copyright # text-and-data-mining-for-non-commercial- 


| 


202304 


Study on the Design of Fair Use Rules for Text and Data Mining 
in the Age of Artificial Intelligence 

Wu Gao'” 

! School of Law, Guangxi Normal University, Guilin 541004 


Huang Xiaobin? 


“School of Information Management,Sun Yat-sen University , Guangzhou 510006 


Xiv 


@ Abstract: 
E behavior in the United States, the United Kingdom, the European Union, Japan and Germany, this paper puts 


| Purpose/significance | Based on the comparative analysis of the legislative or judicial responses to 


ard the design idea of fair use rules of TDM in China. | Method/process | Firstly, the technical characteristics 
and challenges of text and data mining in the era of artificial intelligence were analyzed, and the differences between 
publishers and libraries on the fair use of TDM were introduced. Then, based on the comparative analysis of the legal 
response mechanism of representative countries on the fair use of TDM, from the subject, object, purpose, behavior 
and other conditions of TDM exception, this paper demonstrated the specific content of TDM fair use rule in China. 
| Result/conclusion | Text and data mining by reproduction, extraction, adaptation or limited dissemination of any 
work by any institution or individual for scientific research or other reasonable purposes constitutes fair use, but rea- 
sonable royalties shall be paid for the use of works from illegal sources. 
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